Des séquences aux tendances
نویسندگان
چکیده
RÉSUMÉ. Les données temporelles peuvent être traitées de nombreuses façons afin d’en extraire des connaissances. La découverte de motifs séquentiels met en évidence des sous-séquences fréquentes contenues dans des séquences d’enregistrements annotés temporellement. L’analyse des accès à un site web permet par exemple de découvrir que “5% des utilisateurs accèdent à la page register.php puis à la page help.html”. Cependant, les motifs séquentiels ne permettent pas d’extraire des tendances temporelles, du type “une augmentation du nombre de requêtes au formulaire d’inscription précède souvent une augmentation des requêtes à la page d’aide quelques secondes plus tard”. Dans cet article, nous proposons d’extraire des motifs caractérisant ces évolutions fréquentes grâce à deux algorithmes, TED et EVA. Nous présentons notre approche, implémentée et testée sur des données réelles.
منابع مشابه
Analyse automatique de film - Des séquences d'images aux séquences d'actions. (Computational Film Analysis - From image sequences to action sequences)
متن کامل
Sélection de modèles par des méthodes à noyaux pour la classification de données séquentielles
Ce travail concerne le développement de méthodes de classification discriminantes pour des données séquentielles. Quelques techniques ont été proposées pour étendre aux séquences les méthodes discriminantes, comme les machines à vecteurs supports, par nature plus adaptées aux données en dimension fixe. Elles permettent de classifier des séquences complètes mais pas de réaliser la segmentation, ...
متن کاملAnalyse de séquences d'événements avec TraMineR
Les méthodes de fouille de motifs séquentiels fréquents ont donné lieu, depuis le travail fondateur de Agrawal et Srikant (1995), à un grand nombre de travaux de recherche. La librairie TraMineR pour l’environnement statistique R cherche à rendre ces méthodes accessibles aux chercheurs de divers domaines désirant analyser ou visualiser des ensembles de séquences d’événements. Il est à noter que...
متن کاملExtraction de Séquences Fréquentes : Des Bases de Données Statiques aux Flots de Données
HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau...
متن کاملChamps de Markov conditionnels pour le traitement de séquences
Résumé. Les modèles conditionnels du type modèles de Markov d’entropie maximale et champs de Markov conditionnels apportent des réponses aux lacunes des modèles de Markov cachés traditionnellement employés pour la classification et la segmentation de séquences. Ces modèles conditionnels ont été essentiellement utilisés jusqu’à présent dans des tâches d’extraction d’information ou d’étiquetage m...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2008